確率の世界において、 確率変数 は代数における未知数のプレースホルダーではありません。むしろ、 形式的な変換装置です。これは実数値関数 $X: S \rightarrow \mathbb{R}$ であり、実験の質的結果(例:「白いボールを引く」)を数量的な数値(例:「-1ドル」)に変換します。
変換の論理
確率変数を使うことで、抽象的な結果の集合について話すのをやめ、数値でイベントを議論し始めます。たとえばコインを3回投げた場合、集合 $\{HHT, HTH, THH\}$ を見ることなく、$X$ を「表の枚数」と定義し、単に $X=2$ というイベントを分析します。
確率変数は 離散型 その範囲が有限または 可算無限 (整数のように)。この区別は非常に重要であり、なぜなら積分ではなく 和計算 (∑)を使って総確率を求められるからです。
確率質量関数(PMF)
PMF(確率質量関数)は、離散型確率変数が特定の値 $a$ をとる確率を表します。以下の2つの不可侵な公理を満たす必要があります:
- $p(x_i) \geq 0$(負の確率は存在しない)。
- $\sum_{i=1}^{\infty} p(x_i) = 1$(すべての可能な結果をカバーするため、確率質量の合計は1でなければならない)。
具体例:壺のパラドックス
白8個、黒4個、オレンジ2個のボールが入った壺を考えます。ボールを1つ引き、$X$ を当り・負けとして定義します。黒を引けば+2ドル、白を引けば-1ドルです。このとき、確率質量関数(PMF)により「ボールを引く」という行為を財務分布に変換し、破産する確率と破産せずに均衡する確率を計算できます。
もし $p(i) = c\lambda^i/i!$ ($i=0, 1, 2, \dots$)であれば、まず和が1になるように $c$ を求めます。$e^\lambda$ のテイラー展開を使えば $c = e^{-\lambda}$ と分かります。よって、$P\{X=0\} = e^{-\lambda}$ かつ $P\{X>2\} = 1 - e^{-\lambda}(1 + \lambda + \lambda^2/2)$ となります。